# Common Voice數據集

Whisper Kurmanji
Apache-2.0
針對庫爾德語庫爾曼吉方言的自動語音識別模型,基於Whisper架構微調
語音識別 Safetensors 其他
W
amedcj
272
1
Whisper Small Ta
Apache-2.0
該模型是基於OpenAI的Whisper Small在泰米爾語Common Voice 17.0數據集上微調的語音識別模型,詞錯誤率(WER)為43.23%。
語音識別 Transformers 其他
W
navin-kumar-j
38
1
Whisper Small Fr
Apache-2.0
這是一個基於法語數據集微調的Whisper-small語音識別模型,詞錯誤率相比基線模型降低了6.793個百分點。
語音識別 Transformers 法語
W
mozilla-ai
30
1
Whisper Base Pl
Apache-2.0
基於OpenAI Whisper-base模型在波蘭語Common Voice 17.0數據集上微調的語音識別模型
語音識別 Transformers 其他
W
marcsixtysix
27
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
基於openai/whisper-small在Common Voice 17.0數據集上微調的日語語音識別模型
語音識別 Transformers 日語
V
vlzcrz
28
1
Whisper Large V3 Cantonese
Apache-2.0
基於Whisper v3微調的粵語自動語音識別模型,在Common Voice 17數據集上訓練
語音識別 Transformers 其他
W
khleeloo
25
4
Finetuned Whisper Mr
Apache-2.0
基於simran14/mr-model-h在Common Voice 17.0馬拉地語數據集上微調的Whisper小型語音識別模型
語音識別 Transformers 其他
F
simran14
38
1
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在common_voice_16_1數據集上微調的阿姆哈拉語語音識別模型
語音識別 Transformers
W
DipsankarSinha
18
2
Whisper Large V3 Japanese 4k Steps
Apache-2.0
基於openai/whisper-large-v3在Common Voice 16.1日語數據集上微調的語音識別模型,訓練4000步
語音識別 Transformers 日語
W
drewschaub
94
4
Wav2vec2 Large Xls R 300m Albanian Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_albanian數據集上微調的語音處理模型,適用於阿爾巴尼亞語相關任務。
語音識別 Transformers
W
Alimzhan
8,810
1
Wav2vec2 Large Xlsr Mvc Swahili
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53微調的版本,專門用於斯瓦希里語(Swahili)的自動語音識別任務。
語音識別 Transformers 其他
W
eddiegulay
9,413
2
Whisper Small Dv
Apache-2.0
基於OpenAI Whisper-small模型微調的迪維希語(馬爾代夫官方語言)自動語音識別模型,在Common Voice 13數據集上訓練
語音識別 Transformers 其他
W
voxxer
21
1
Whisper Small Fa
Hezar團隊基於Common Voice數據集的波斯語部分微調的Whisper (small) 模型,可用於自動語音識別任務。
語音識別 其他
W
hezarai
363
11
Tts Thai Last Step
MIT
這是一個基於Tacotron2架構的泰語文本轉語音模型,使用修改後的Common Voice泰語數據集訓練,聲音經過處理不保留原始特徵。
語音合成 其他
T
lunarlist
42
2
Tts Thai
MIT
基於Tacotron2架構的泰語文本轉語音模型,使用修改後的Common Voice泰語數據集訓練
語音合成 其他
T
lunarlist
54
1
Banglaasr
MIT
這是一個基於Whisper small架構的孟加拉語自動語音識別模型,在約400小時的Mozilla Common Voice數據集上微調訓練,詞錯誤率4.58%
語音識別 Transformers
B
bangla-speech-processing
782
15
Whisper Large Persian
Apache-2.0
基於Whisper架構的波斯語自動語音識別模型,在Common Voice 11.0波斯語數據集上微調
語音識別 Transformers 其他
W
steja
800
12
Whisper Large V2 Kazakh
Apache-2.0
該模型是基於OpenAI的Whisper Large V2在哈薩克語Common Voice 11.0數據集上微調的語音識別模型
語音識別 Transformers 其他
W
DrishtiSharma
40
3
Whisper Tiny Es
Apache-2.0
基於OpenAI Whisper-tiny模型在西班牙語數據集上微調的語音識別模型
語音識別 Transformers 西班牙語
W
arpagon
26
3
Exp W2v2t Zh Cn Wavlm S596
Apache-2.0
基於microsoft/wavlm-large模型微調的中文語音識別模型,支持簡體中文,使用Common Voice 7.0 (zh-CN)數據集訓練。
語音識別 Transformers
E
jonatasgrosman
22
1
Exp W2v2t Fa Hubert S801
Apache-2.0
基於facebook/hubert-large-ll60k模型微調的波斯語自動語音識別模型,使用Common Voice 7.0波斯語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
16
0
Exp W2v2t Sv Se Wavlm S42
Apache-2.0
基於microsoft/wavlm-large微調的瑞典語自動語音識別模型,適用於16kHz採樣率的語音輸入。
語音識別 Transformers
E
jonatasgrosman
20
0
Exp W2v2t It Wavlm S895
Apache-2.0
基於microsoft/wavlm-large模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
42
0
Exp W2v2t It No Pretraining S842
Apache-2.0
基於隨機初始化的wav2vec2模型進行微調,用於意大利語語音識別任務,訓練數據採用Common Voice 7.0(意大利語)的訓練集分割部分。
語音識別 Transformers 其他
E
jonatasgrosman
18
0
Exp W2v2t It Xlsr 53 S387
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
18
0
Exp W2v2t It Wav2vec2 S609
Apache-2.0
基於facebook/wav2vec2-large-lv60模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
18
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的日語自動語音識別模型,使用Common Voice 7.0日語數據集訓練
語音識別 Transformers 日語
E
jonatasgrosman
20
0
Exp W2v2t Th Hubert S533
Apache-2.0
基於facebook/hubert-large-ll60k微調的泰語語音識別模型,訓練數據來自Common Voice 7.0
語音識別 Transformers 其他
E
jonatasgrosman
19
0
Exp W2v2t En Vp Nl S281
Apache-2.0
基於facebook/wav2vec2-large-nl-voxpopuli模型微調的英語語音識別模型,使用Common Voice 7.0訓練集進行訓練。
語音識別 Transformers 英語
E
jonatasgrosman
18
0
Wav2vec2 Large Xls R 300m Hindi Epochs15 Colab
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在common_voice數據集上微調的語音識別模型,支持印地語。
語音識別 Transformers
W
vai6hav
17
0
Wav2vec2 Large Xls R 300m Tamil Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的泰米爾語語音識別模型
語音識別 Transformers
W
Priya9
21
0
Model Facebookptbrlarge
Apache-2.0
基於Facebook wav2vec2-large-xlsr-53-portuguese模型在common_voice數據集上微調的巴西葡萄牙語語音識別模型
語音識別 Transformers
M
Vkt
22
0
Wav2vec2 Base Common Voice 50p Persian Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在波斯語數據集上微調的語音識別模型,支持波斯語語音轉文本任務。
語音識別 Transformers
W
zoha
21
0
Wav2vec2 Base Common Voice Persian Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在波斯語數據集上微調的語音識別模型,主要用於波斯語語音轉文本任務。
語音識別 Transformers
W
zoha
21
0
Wav2vec2 Common Voice Tr Demo Dist
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - TR土耳其語數據集上微調的自動語音識別(ASR)模型,在評估集上取得了0.3242的詞錯誤率。
語音識別 Transformers 其他
W
cromz22
26
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 5
Apache-2.0
這是一個基於wav2vec2架構的土耳其語語音識別模型,在Common Voice數據集上微調,詞錯誤率(WER)為0.3634。
語音識別 Transformers
W
husnu
22
0
Wav2vec2 Large Xls R 300m Turkish Colab Common Voice 8 4
Apache-2.0
該模型是基於Facebook的wav2vec2-xls-r-300m模型,在common_voice土耳其語數據集上微調的語音識別模型。
語音識別 Transformers
W
husnu
19
0
Wav2vec2 Xls R 300m Mr Cv9 With Lm
Apache-2.0
基於Facebook XLS-R-300M模型在馬拉地語語音數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
anuragshas
23
0
Wav2vec2 Xls R 300m Ur Cv9 With Lm
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在烏爾都語語音數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers 其他
W
anuragshas
18
1
Common Voice Lithuanian Fairseq
Apache-2.0
基於Common Voice數據集訓練的立陶宛語自動語音識別模型,使用wav2vec2架構和fairseq框架實現。
語音識別 Transformers 其他
C
birgermoell
30
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase